DeepSeek, R1 업그레이드로 AI 거인들에 도전장…추론 능력 대폭 강화
중국 AI 스타트업 DeepSeek가 오픈소스 추론 모델의 대규모 업그레이드 버전인 R1-0528을 공개했다. 이번 업그레이드로 DeepSeek의 모델은 OpenAI, Google 등 독점 모델과 견줄 만한 성능을 보이며, 수학적 정확도는 AIME 2025 테스트...
중국 AI 스타트업 DeepSeek가 오픈소스 추론 모델의 대규모 업그레이드 버전인 R1-0528을 공개했다. 이번 업그레이드로 DeepSeek의 모델은 OpenAI, Google 등 독점 모델과 견줄 만한 성능을 보이며, 수학적 정확도는 AIME 2025 테스트...
구글이 Gemini 2.5 Pro 기반의 자율형 AI 코딩 에이전트 'Jules'를 전 세계 공개 베타로 출시했다. Jules는 안전한 클라우드 환경에서 독립적으로 버그 수정, 테스트, 기능 구현 등 코딩 작업을 처리하며, 개발자는 더 중요한 업무에 집중할 수 있...
AI 기반 코딩 도구가 소프트웨어 개발을 혁신하고 있다. GitHub Copilot, Cursor, 그리고 다양한 신생 대안들이 개발자의 코드 작성, 디버깅, 최적화 방식을 변화시키고 있다. 이들 도구는 반복 작업을 자동화하고, 지능형 제안을 제공하며, 코드베이스...
미스트랄 AI가 All Hands AI와 협력해 소프트웨어 엔지니어링 작업에 특화된 240억 매개변수 AI 모델 Devstral을 공개했다. 2025년 5월 21일 Apache 2.0 라이선스로 출시된 이 모델은 SWE-Bench Verified 벤치마크에서 다른...
마이크로소프트의 GitHub가 개발자가 이슈를 할당하면 독립적으로 프로그래밍 작업을 수행할 수 있는 새로운 자율형 코딩 에이전트를 출시했다. 이 에이전트는 GitHub Actions 기반의 안전한 환경에서 동작하며, 개발자가 검토 및 수정할 수 있는 초안 풀 리퀘...
OpenAI가 GPT-4.1이라는 새로운 모델 패밀리를 출시했다. 표준, 미니, 나노 버전으로 구성된 이 모델들은 모두 코딩과 지시 사항 이행에 최적화됐으며, 최대 100만 토큰의 대규모 컨텍스트 윈도우를 지원한다. 이 API 전용 모델들은 코딩 벤치마크에서 기존...